场景理解:在计算机视觉与人工智能中,指让机器从图像或视频中理解“场景里有什么、它们在哪里、它们在做什么以及彼此关系如何”的能力(通常包含目标识别、语义/实例分割、关系推理、场景语义等)。该短语也可泛指人对环境情境的理解,但在技术语境中更常见于视觉领域。
/siːn ˌʌndərˈstændɪŋ/
The robot needs scene understanding to navigate safely.
机器人需要场景理解能力才能安全导航。
Scene understanding combines object detection, segmentation, and reasoning to infer what is happening in a complex image.
场景理解把目标检测、分割和推理结合起来,用于推断一张复杂图像中正在发生什么。
scene 源自希腊语 skēnē(原指“舞台布景/舞台”),后来引申为“场面、景象”。understanding 来自古英语 understandan,意为“理解、领会”。合在一起,scene understanding 字面即“对场景/景象的理解”,在现代多被固定用于描述机器对视觉场景进行语义层面的解析与推断。